模式识别与人工智能
2025年4月4日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2016, Vol. 29 Issue (6): 542-547    DOI: 10.16451/j.cnki.issn1003-6059.201606008
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于困惑度数据挑选的半监督声学建模*
解传栋,郭武
中国科学技术大学 语音及语言信息处理国家工程实验室 合肥 230027
Semi-supervised Acoustic Modeling Based on Perplexity Data Selection
XIE Chuandong, GUO Wu
National Engineering Laboratory for Speech and Language Information Processing,University of Science and Technology of China, Hefei 230027

全文: PDF (367 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 针对资源稀少情况下小语种的声学建模问题,提出根据解码后文本的困惑度挑选无监督数据并重新训练声学模型的策略.使用少量精标数据训练得到一个初始种子模型后,解码大量无监督数据,计算解码后的文本与精标数据文本的困惑度,从中挑选与精标数据相近的数据,再将这些数据与原有精标数据共同用于声学模型训练.为了提高解码的无监督数据的正确性,在基于深层神经网络的模型参数训练中,当最后一次模型参数更新时只使用精标数据修正网络参数.在NIST 2015年关键词识别比赛中Swahili语的VLLP识别任务上,相比其它方法,文中方法的识别率有一定提升.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
解传栋
郭武
关键词 半监督训练困惑度深层神经网络(DNN)    
Abstract:For acoustic modeling of small languages with rare resource, a perplexity based approach is proposed to select unsupervised data in the decoding transcription and retrain the acoustic model. The large unsupervised corpus is decoded using the initial acoustic model trained with a small amount of labeled data, and the perplexity between the decoded text and the training set is calculated. Then, the selected data similar to the labeled data are used to train the acoustic model along with the labeled data. To improve the correctness of the decoded unsupervised data,the final network parameters of acoustic model are adjusted by only using the correct labeled data in the last iteration during the training of model parameters based on deep neural network. In the VLLP recognition task of Swahili provided by NIST 2015 open keyword search competition, the proposed approach can improve the recognition rate compared with other methods.
Key wordsSemi-supervised Training    Perplexity    Deep Neural Networks (DNN)   
收稿日期: 2015-10-21     
ZTFLH: TN 912.3  
基金资助:安徽省自然科学基金项目(No.1408085MKL78)资助
通讯作者: 郭 武(通讯作者),男,1973 年生,博士,副教授,主要研究方向为语音识别、说话人识别.E-mail:guowu@ustc.edu.cn.   
作者简介: 解传栋,男,1990年生,硕士研究生,主要研究方向为语音识别、关键词检索.E-mail:xcdahu@mail.ustc.edu.cn.
引用本文:   
解传栋,郭武. 基于困惑度数据挑选的半监督声学建模*[J]. 模式识别与人工智能, 2016, 29(6): 542-547. XIE Chuandong, GUO Wu. Semi-supervised Acoustic Modeling Based on Perplexity Data Selection. , 2016, 29(6): 542-547.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201606008      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2016/V29/I6/542
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn